package rddSummary.transition.key_value_type

import org.apache.spark.{SparkConf, SparkContext}

object test_groupByKey {
  def main(args: Array[String]): Unit = {

    val conf = new SparkConf().setAppName("test").setMaster("local")
    val sparkContext = new SparkContext(conf)

    val dataRDD1 = sparkContext.makeRDD(List(("a",1),("b",2),("c",3),("a",1),("b",2)))

    /**
     * 将数据源的数据根据 key 对 value 进行分组
     */

    val value = dataRDD1.groupByKey(2)

    value.collect().foreach(println)

    sparkContext.stop()
  }

}
